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PROLOGO 


La Estadística en el entorno está presente en la mayoría de las 
actividades, desde la perspectiva de la Docencia es imprescindible que, se 
domine el tratamiento de datos, por ejemplo, los resultados obtenidos en una 
evaluación y con la interpretación de los resultados se puedan tomar decisiones 
de fortalecimiento académico. 

La educación inicial es crucial en la formación de los futuros 
ciudadanos, sentando las bases para el desarrollo de habilidades cognitivas y 
socioemocionales esenciales para el éxito en la vida. Es en este nivel educativo 
donde la estadística puede comenzar a desempefiar un rol fundamental, 
introduciendo a los nifios en el mundo de los datos y el análisis de información 
de manera lúdica y significativa. 

La presente obra pretende fortalecer el aprendizaje de Estadística desde 
el contexto educativo respecto a la Educación en la primera infancia, donde los 
futuros docentes cuenten con una guía para su aprendizaje. La guía cuenta 
con ejemplos ilustrativos para la mejor comprensión, los diferentes ejercicios 
están contextualizados y pretenden ser un referente para la construcción de sus 
propios ejemplos. 
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UNIDADI 


ESTADÍSTICA DESCRIPTIVA 


c QUÉ ES LA ESTADÍSTICA? 


La Estadística es fundamental en investigación y análisis de datos, su finalidad es 
recopilar, organizar, interpretar y presentar datos numéricos para describir fenómenos, 
realizar inferencias y tomar decisiones informadas, esta ciencia se aplica en muchos 
campos, desde la economía hasta la medicina, pasando por la ingeniería y las ciencias 
sociales, mediante métodos estadísticos, los investigadores pueden obtener conclusiones 
significativas a partir de conjuntos de datos complejos, identificando patrones, tendencias 
y relaciones que ayudan a comprender mejor el mundo que nos rodea (Hernández et al., 
2023). 

Una parte esencial es la recolección sistemática y precisa de datos mediante 
encuestas, experimentos y observaciones para recopilar información relevante sobre 
variables de interés. Posteriormente, los datos se organizan en tablas, gráficos o 
distribuciones que permiten una visualización clara y facilitan su análisis, siendo la calidad 
de los resultados que depende de la eficacia y la precisión de los parámetros recolectados, 
por lo que es crucial emplear técnicas rigurosas en esta etapa inicial (Casas et al., 2009). 

Otro aspecto fundamental de la estadística es la inferencia, que implica hacer 
generalizaciones o predicciones sobre una población basáândose en una muestra 
representativa de esa localidad, esta técnica se utiliza para sacar conclusiones más allá 
de los datos específicos observados y para estimar parâmetros desconocidos, la inferencia 
estadística se basa en principios probabilísticos y requiere el uso adecuado de métodos 
como intervalos de confianza, pruebas de hipótesis y análisis de regresión para obtener 
resultados significativos y válidos (Yanqui et al., 2024). 

Además de su papel en la investigación académica y científica, la estadística 
desempefia un papel crucial en la toma de decisiones en el âmbito empresarial y 
gubernamental, las empresas utilizan análisis estadísticos para evaluar el rendimiento, 
prever tendencias de mercado y optimizar procesos, del mismo modo, los gobiernos utilizan 
datos estadísticos para formular políticas públicas, asignar recursos y monitorear indicadores 
clave de desarrollo económico y social, a continuación se presenta un organizador gráfico 


que resume de manera general la estadística: 


Estadística Descriptiva 
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Figura 1 


Modelo de una matriz de responsabilidad RACI 


Estadística 
Descriptiva Inferencial 
é ô 
Recolecta, ordena Analiza o investiga a una población 
y analiza los datos através de resultados obtenidos 
de una muestra 
- i ô ; 

j i i Paramétricas: 
Diagrama de barras mas de tendencia Punta Normal Student 
Histogramas Fisher Anova 

Medidas de dispersión ana 
Polígono de frecuencias Por intervalos No paramétricas: 
E se Medidas de correlación po cu Nós 
iii De Ajuste de Bondad 


Nota: Esta figura representa un ejemplo de una matriz de responsabilidad RACI, misma que fue 
elaborada por los autores, 2024 


CONCEPTOS CLAVE 


Población 


En el contexto de la estadística, es fundamental entender la distinción entre 
poblaciones finitas e infinitas, ya que esta diferencia afecta la forma en que se abordan los 
problemas de muestreo y la inferencia estadística. 

Población finita: un conjunto definido y limitado de elementos o individuos que 
comparten una característica común y que se pueden contar o enumerar de manera precisa, 
en este tipo, cada miembro se conoce y puede identificar; por ejemplo, la población de 
estudiantes inscritos en una escuela durante un afio académico específico o la cantidad de 
empleados en una empresa constituyen ejemplos de poblaciones finitas, la característica 
de este tipo de población es que su tamafio total es conocido y finito, lo que permite analizar 
todos los elementos si es necesario, como en el caso de un censo (Castafieda et al., 2010). 


Estadística Descriptiva 


Población infinita: Una población infinita no tiene límite definido en términos de 
tamafio o extensión y no puede enumerarse o medirse en su totalidad, este tipo de población 
es conceptual y teórica, y ejemplos comunes incluyen la totalidad de los números naturales, 
la población mundial o la cantidad teórica de lanzamientos de una moneda, en el contexto 
estadístico, trabajar con este tipo de poblaciones implica que solo podemos acceder a 
una muestra limitada de elementos para realizar inferencias sobre la población en su 
conjunto; las técnicas de muestreo probabilístico que se utilizan para seleccionar muestras 
representativas que permitan generalizar conclusiones sobre la población (Guevara et al., 
2020). 


Muestra 


Para ilustrar cómo se aborda el estudio de una población infinita en estadística, 
consideremos estimar la proporción de personas que prefieren un cierto producto en una 
ciudad grande, ya que la población de la ciudad es casi incontable, es imposible encuestar 
a cada individuo, en cambio, se selecciona una muestra representativa con técnicas de 
muestreo probabilístico, como el muestreo aleatorio simple (Alban et al., 2020). 


Figura 2 


Representación gráfica de la población 


POBLACIÓN 


MUESTRA 


Nota: Esta figura muestra representativamente como se considera una muestra a partir de una 
población 


CÁLCULO MUESTRAL 


Para calcular el tamafio de la muestra y esta sea fiable, es necesario emplear las siguientes fórmulas: 
Para una muestra con Población Finita Para una muestra con Población Infinita 
N+Z2xpx+q Z2xp+q 


E Es(N-D+Z2=p+q n=""e 


Estadística Descriptiva 


Donde: 


n = Tamafio de la muestra que se busca 
N = Tamafio de la Población 


Z = Parâmetro de confianza obtenido de los niveles de confianza, el valor 
recomendable cuando se desconoce es del 95% entonces Z= 1,96 


e = Error de estimación aceptado, cuando no se conoce su valor queda al criterio 
del investigador, el valor generalmente varía entre 1% y 9%, lo recomendable es 
trabajar con el valor al 3% (0,03) y 5% (0,05). 


p = Probabilidad de éxito que ocurra el evento, cuando no se conoce se trabaja con 
el 50% cuyo valor es (0,5). 


q = Probabilidad de que No ocurra el evento, cuando no se conoce se trabaja con el 
50% cuyo valor es (0,5). 


DATO ESTADÍSTICO 


Un dato estadístico es un valor numérico que describe alguna característica o 
propiedad de interés en un conjunto de datos, estos valores son fundamentales en el campo 
de la estadística, ya que proporcionan información cuantitativa que puede ser analizada y 
utilizada para tomar decisiones informadas, los datos estadísticos pueden ser recopilados 
a través de diferentes métodos como encuestas, experimentos o registros administrativos, 
y su análisis permite identificar patrones, tendencias y relaciones entre variables, ejemplos 
comunes de datos estadísticos incluyen la edad promedio de una población, la tasa de 
desempleo en una región específica, o la cantidad de ventas de un producto durante un 
periodo de tiempo determinado (Pérez et al., 2012). 


VARIABLE ESTADÍSTICA 


Una variable estadística es una característica o atributo que puede tomar diferentes 
valores en un estudio o experimento, estas pueden ser de dos tipos principales: variables 
cuantitativas, que representan cantidades numéricas y pueden ser medidas con precisión 
(como la edad de una persona o el ingreso anual), y variables cualitativas, que representan 
cualidades o categorías que no pueden ser medidas numéricamente (como el género, la 
profesión o el estado civil). 

Las variables estadísticas son fundamentales porque permiten describir y analizar 
fenómenos de interés mediante la recolección y análisis de datos, dependiendo del tipo 
de variable y del objetivo del estudio, se utilizan diferentes métodos estadísticos para su 
análisis, como el cálculo de medidas de tendencia central (como la media o la mediana) o 
la realización de pruebas de hipótesis para determinar relaciones entre variables (Franco 
& Solórzano, 2020). 
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Figura 3 


Clasificación de variables estadísticas 


Pueden medirse y representarse 
con un valor numérico. Este tipo de 
variables son las que aparecen con 
más frecuencia y permiten un 
análisis más detaliado que las 


Nota: Esta figura representa un ejemplo de una matriz de responsabilidad RACI, misma que fue 
elaborada por los autores, 2024 


DISTRIBUCIÓN DE FRECUENCIAS 


La distribución de frecuencias es una técnica estadística utilizada para ordenar y 
resumir datos numéricos o categóricos en tablas que muestran la frecuencia con la que 
ocurren diferentes valores o categorías, contando el número de veces que ocurre cada 
valor en un conjunto de datos y organiza esta información en una tabla con categorias o 
rangos de valores junto con sus respectivas frecuencias (Fernández & Vela, 2021). 

La distribución de frecuencias es útil para identificar patrones, tendencias y 
características destacadas de los datos, lo que facilita su análisis y comprensión, además, 
es posible calcular medidas descriptivas como la moda (el valor más frecuente), la mediana 
(el valor central) y la media (el promedio aritmético), que proporcionan información adicional 
sobre la distribución de los datos. 
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TABLAS DE FRECUENCIAS 


Una tabla de frecuencias es una representación organizada y estructurada de datos 


que muestra la distribución de frecuencias de diferentes valores o categorías dentro de un 


conjunto de datos, esta tabla consta de columnas que representan los valores o intervalos 


de valores posibles y una columna adicional que muestra la frecuencia con la que cada 


valor o intervalo ocurre en los datos (Rumsey, 2002). 


En cuanto a datos numéricos, los valores se agrupan en intervalos o clases para 


facilitar la interpretación y el análisis, la tabla de frecuencias da una visión clara y concisa 


de la distribución de los datos, identificando rápidamente los valores más comunes, los 


valores atípicos y las tendencias generales, además, a partir de una tabla, se pueden 


calcular medidas estadísticas importantes, como la moda, la mediana y la media. 


Los tipos de frecuencia pueden ser 


Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia 
Absoluta (fo fi) Relativa absoluta Porcentual relativa porcentual 

(fr) acumulada (f %) acumulada (Fr) acumulada 

(Fa) (Fr %) 

Es el número Indica la Es la suma También Eslasumade Se obtiene 
de veces que proporción | acumulada de llamada la frecuencia multiplicando 
aparece o se con quese lafrecuencia frecuencia relativa primera | la frecuencia 
repite elvalor de repite un absoluta relativa con la segunda, relativa 
la variable. valor. primera con porcentual. este valor con acumulada por 
La suma de Se divide la la segunda, Indica el latercera, y así 100%. 
las frecuencias frecuencia | este valor con valor de sucesivamente. 
absolutas es el absoluta la tercer y así la fr en 
número de datos entre el sucesivamente. porcentaje, 
N. número se obtiene 

total de multiplicando 

datos N. por 100% 

La suma La suma 

de las fr es de las 

siempre 1. frecuencias 

porcentuales 
] es siempre 
fr= fi 100%. 
N 


Ejemplo con datos No agrupados 


Ordene los datos y construya la tabla de distribución de frecuencias para los 


siguientes datos: 


Las notas de las evaluaciones parciales de 30 estudiantes en la asignatura de 


Estadística Aplicada son las siguientes: 
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8 7 5 10 9 9 8 7 10 6 
10 10 9 5 8 
7 7 9 9 8 10 5 


Proceso de solución 


* | Como primer paso se debe ordenar los datos de la variable calificación en 


orden ascendente de menor a mayor 


* | Segundo, construir la tabla de frecuencias 


. Posterior, contar las frecuencias de cada calificación 


* Por último, realizar los cálculos respectivos 


Calificación Fi Fr Fa 1% Fr Fr% 
5 4 4380= 4 0,133 *100% = 0,133 0,133*100% = 
0,133 13,3 % 13,3% 
6 2 2180= 4+2=6 0,066 *100% = 0,133 + 0,066= 0,199*100% = 
0,066 6,6 % 0,199 19,9% 
7 6 630=0,2 6+6=12 0,2*100% =20% 0,199+0,2= 0,399*100% = 
0,399 39,9% 
8 6 630=0,2 12+46= 0,2*100% = 20% 0,399 +0,2 = 0,599*100% = 
18 0,599 59,9% 
9 7 TI30= 18+7 0,233 *100% = 0,599 + 0,233 = 0,832*100% = 
0,233 =25 23,3% 0,832 83,2% 
10 5 5/80= 25+5 = 0,166 *100% = 0,832 +0,166=1 1*100% = 100% 
0,166 30 16,6% 
Total 30 1 100% 


DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS AGRUPADOS 


Se usará esta tabla de frecuencias cuando la variable tiene una gran cantidad de 
datos o es una variable continua. Las agrupaciones de los datos se hacen en intervalos de 
igual amplitud a los cuáles se denominan clases. 

Un intervalo es un conjunto de números contenidos entre dos extremos que se 


denominan límite inferior (valor extremo izquierdo) y límite superior (valor extremo derecho). 


Pasos para construir una tabla de frecuencias para datos agrupados: 


Cálculo del Rango R: es la diferencia entre el (valor mayor) con el (menor valor) 
del conjunto de datos. 
R= XX 


min 
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Cálculo del número de intervalos K o |: es el número de subgrupos que se 
conformarán dentro del grupo de datos. 
Para el cálculo del número de intervalos se sugiere emplear la fórmula de Sturges: 
k=1+3,322*log N 
Donde: 
N= es el número de datos 
Por otro lado, también es recomendable emplear la raíz cuadrade de N, donde k = 


VN 


Consideraciones 


* -Sielvalor de k es 7,3 se redondea a 7 intervalos 
* | Sielvalor de k es 6,64 se redondea a 7 intervalos 


Cálculo de la amplitud A del intervalo: es el número de datos que contendrá cada 
intervalo de clase. 


Se obtiene dividiendo el rango (R) para el número de intervalos (k): 


R 
A=— 
k 


Límites de clase: cada clase es un intervalo que va desde el límite inferior (Li) 
hasta el Iímite superior (Ls). 

Cada intervalo: empieza cerrado [ y finaliza abierto), se forma empezando por el 
(menor valor) de los datos y sumando la cantidad que indique la amplitud y se determina 
el límite superior. 

Cálculo de la marca de clase X: es el punto medio de cada intervalo, se obtiene 
sumando el límite superior con el inferior y dividiendo entre 2. 


Ls + Li 
iú 2 


Pasos para construir una Tabla de frecuencias para datos agrupados 
1. Determinar el rango (R) 

Hallar el número de intervalos 

Determinar la amplitud o ancho de clase 


Hallar el límite inferior y superior de cada clase y sus marcas de clase 


q Ro won 


Ordenar los valores encontrados en las columnas de la tabla de distribución de 
frecuencias 
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Modelo de tabla 


Intervalo de Marcas de Frecuencia Frecuencia Frecuencia Frecuencia 
clase clase (x) absoluta (fo fi) acumulada (F, relativa (fr) relativa 
Fao Fi) acumulada (Fr) 
Es cada Eselpunto Es el número Esel resultado Esel Es el resultado 
intervalo en que medio de veces que deirsumando | cociente de ir sumando 
se ha decido de cada se repite un las frecuencias entre la las frecuencias 
agrupar los intervalo valor o evento absolutas frecuencia relativas 
subgrupos de absoluta y el 
datos número de 
datos 
Ejemplo: 


Las edades de pacientes que acuden a un centro de salud en un día, son las 


siguientes: 
2 7 10 
22 6 25 
13 32 13 
20 13 6 
Solución 


1. Hallamos el rango R 


R=35-2 
R=33 


19 
20 
18 
35 


2. Hallamos el número de intervalos K 


K=1+ 3,322 * log(N) 


K=1 + 3,322 * log(20) 
k=1+83,322* (1,301) 


K=1+4,323 
K = 5,323 


K=5 se redondea a 5 


3. Determinamos la amplitud de clase (A) 


R 
A=— 
k 
33 
A=— 
A=6,6 
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A = 7 se redondea a 7 


4. Construimos la tabla y realizamos los cálculos: 


Formamos los intervalos: 


Límite inferior + Amplitud Límite superior 
2 +7 9 

9 +7 16 

16 +7 23 

23 +7 30 

30 +7 37 


5. Calculamos las marcas de clase 


Ls + Li 
E 2 
9+2 11 
X= = = 55 
2 2 
16+9 25 
X= = = 125 
2 2 
23+16 39 
X= = = 195 
2 2 
30 + 23 53 
X= = = 26,5 
2 
37 + 30 67 
X= E = = 33,5 


6. Completamos la tabla y seguimos con los otros cálculos de la misma 
manera que se realizó en el ejemplo de la distribución para datos no 
agrupados. 

Para la frecuencia absoluta, se debe observar los datos que están dentro del 
intervalo tomando desde el valor del límite inferior hasta antes del límite superior, si hay un 
número que coincida con el límite superior no se le tomará en cuenta en ese intervalo sino 


en el siguiente. 
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Edades Marcas de Frecuencia Frecuencia Frecuencia Frecuencia relativa 


(intervalos) clase X GORE acumulada F relativa fr acumulada Fr 
o fi 
2-9) 5,5 5 5 5/20 = 0,25 0,25 
[9 - 16) 12,5 5 5+5=10 5/20 = 0,25 0,25+0,25=0,5 
[16 - 23) 19,5 6 10+6=16 6/20 = 0,3 0,5 +0,3=0,8 
[23 - 30) 26,5 2 16+2-18 2/20 = 0,1 0,8+0,1=0,9 
[30 - 37) 33,5 2 18+2=20 2/20 = 0,1 0,9+0,1=1 
Total 20 1 


Interpretación de algunos datos de la tabla: 

El valor f=6 significa que 6 pacientes fueron atendidos cuyas edades variaban entre 
los 16 y 22 afos. 

El valor X=12,5 significa que 5 pacientes atendidos tenían entre 9 y 15 afios. 

El valor F=18 significa que 18 pacientes fueron atendidos entre los 2 y 29 aros. 

El valor de fr= 0,3 o 30% significa que el 0,3 o 30% de los pacientes tenían entre 
16y 22 afios 

El valor Fr=0,9 o 90% significa que el 0,9 o 90% de los pacientes atendidos tenían 
entre 2 y 29 afios. 


GRÁFICOS ESTADÍSTICOS 


Los gráficos estadísticos son herramientas visuales clave utilizados en el campo de 
la estadística para representar información de manera clara y comprensible, estos permiten 
visualizar patrones, tendencias y relaciones en los datos, lo que facilita la interpretación 
y comunicación de resultados, entre los tipos más comunes de gráficos estadísticos se 
encuentran los histogramas, gráficos de barras, gráficos de dispersión, gráficos circulares 
(o de sectores), y gráficos de líneas, cada uno de estos es adecuado para diferentes tipos 
de datos y objetivos de análisis (Chance, 2002). 

Los histogramas son gráficos utilizados para representar la distribución de frecuencias 
de datos numéricos continuos. Consisten en barras adyacentes cuyas alturas representan 
las frecuencias de intervalos o clases específicas de datos. Los gráficos de barras, por 
otro lado, son útiles para representar la distribución de frecuencias de datos categóricos o 
discretos. Cada barra en un gráfico de barras representa una categoría distinta y la altura 
de la barra indica la frecuencia o conteo de esa categoría (López & Gómez, 2023). 

Los gráficos de dispersión son útiles para visualizar la relación entre dos variables 
numéricas. Cada punto en el gráfico representa una observación que tiene valores 
específicos para ambas variables, y la dispersión de los puntos revela la naturaleza de 
la relación entre las variables (por ejemplo, si existe una correlación positiva, negativa 


o ninguna). Por otro lado, los gráficos circulares son útiles para mostrar proporciones o 
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porcentajes de diferentes categorías en un conjunto de datos. Cada sector del círculo 
representa una categoría específica y su tamafio relativo muestra la proporción que 
representa dentro del total (Karen et al., 2024). 


DIAGRAMA DE BARRAS 


El diagrama de barras es una herramienta visual utilizada en estadística para 
representar datos categóricos o discretos de manera clara y comprensible, este consiste en 
barras rectangulares colocadas horizontal o verticalmente, donde la longitud de cada una 
de estas representa la frecuencia o el conteo de una categoría específica; cada barra está 
separada y etiquetada según la categoría que representa, lo que facilita la comparación 
entre diferentes condiciones y la identificación de las más frecuentes o relevantes en un 
conjunto de datos; este diagrama es especialmente útil para resaltar diferencias o patrones 
entre grupos de datos, ya que permite una visualización directa y fácil de interpretar 
(Monsalve, 2024). 


CARACTERÍSTICA DE UNA GRÁFICA DE BARRAS 


Para crear un diagrama de barras efectivo, hay que seguir algunos principios de 
disefio, por ejemplo, asegurarse de que las barras sean proporcionales a las frecuencias 
que representan y que estén etiquetadas correctamente para que sean identificables, la 
elección entre un diagrama horizontal o vertical depende del tipo de datos y la presentación 
deseada (Aquije et al., 2023). 


Ejemplo: 
En el paralelo A de Educación Inicial 1 de una escuelita, se les preguntó a los 
niãos sobre su color favorito obteniendo el siguiente resultado, como se ilustra en la tabla 


siguiente: 

Color Frecuencia Frecuencia Frecuencia 
absoluta relativa porcentual 

Amarillo 4 0,16 16% 

Rosado 7 0,28 28% 

Azul 5 0,2 20% 

Verde 9 0,36 36% 

Total 25 
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Para graficar el diagrama de barra, se utiliza el programa Excel 
* Primero, ingresamos a Excel 
* | Segundo, colocamos la columna de la variable color y de la frecuencia absoluta 


* — Tercero, se debe seleccionar la columna de datos de la frecuencia desde B2 — 
B5 


Figura 4 


Variable y su frecuencia 


A B 
1 (Color f 
2 |amarillo 4 
3 |rosado Tá 
4 lazul 5 
5 |verde 91 
6 E 


Nota: Esta figura muestra una distribución de la variable color junto a su frecuencia absoluta misma que 


fue elaborada por los autores, 2024 


* | Cuarto, mantenemos la selección y vamos al icono insertar y seleccionamos el 
diagrama de barras 


Figura 5 
Generar un diagrama de barras en Excel 


Archivo Inicio Insertar Disposición de página Fórmulas Datos Revisar Vista Ayuda 


3 EE (o) E Obtener complementos e h? Bm (4) ES 


ue É 0 7 
Tabla Tablas dinámicas Tabla | Ilustraciones EM Mis complêmentas- Columna en 2-D 
dinámica recomendadas 4 hs B recomendados 


Tablas Complementos Ih aÊ NE 


Gráficos 


B2 vo fla 
A B c D E | F G Columnas 3D 
1 |Color f 
2 |amarillo 4 Hm JA JA ii] 
3 |rosado 7 
4 |azul E 
5 |verde 9| Fa go 
6 = 
7] EEBE 
8, 
9 
10] Barra 3D 
n] 
2 2: 
E 
14| 
E ] ln Más gráficos de columnas... 


Nota: Esta figura representa la creación de un gráfico estadístico, mismo que fue elaborada por los 
autores, 2024 
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* Quinto, al hacer clic, inmediatamente aparece la gráfica 


Figura 6 


Gráfico estadístico 


Título del gráfico 


1 2 3 4 


Nota: Esta figura representa un diagrama de barras para frecuencia absoluta, misma que fue elaborada 
por los autores, 2024 


O no mnwr unas cai 


* Sexto, ahora vamos a configurar el gráfico, para que en el eje horizontal apare- 
zcan las etiquetas de los colores 


Para ello hacemos doble clic sobre el diagrama de barras y seleccionamos la 
opción en el ícono de seleccionar datos 


Figura 7 


Edición de título para el diagrama 


Em do 


| | | E E Ê nlzÃ alul nluh E | 1 ] | ] | =| Cambiar Seleccionar | Cambiartipo | Mover 
+ *” fila/columna datos degráfico | gráfico 
Estilos de diseio Datos Tipo Ubicación 
Seleccionar datos 
Cambia el rango de datos incluidos en e! 
o o o e | E o + e | gráfico 
Opciones dt 
E— > Relleno 
= —— “O 
o LES! F 
Título del [Título del gráfico] 4 Conto 
10 4| & Sin lh 
E] = Línea 
8 Y | Línea 
7 
6 
5 Q 
4 
3 
2 
1 
o 


Nota: Esta figura representa la configuración del título del diagrama de barras, misma que fue 
elaborada por los autores, 2024 
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* | Séptimo, aparece una nueva ventana, para editar el eje horizontal se debe ha- 
cer clic en donde dice etiquetas del eje horizontal (categorias) 


Clic en editar y marcar la columna A2 — A5 en nuestros datos de color 


Figura 8 
Edición de ejes 


Rótulos del eje ? X 


Rango de rótulos del eje: 


=Hoja1!$L$27 + | = amarillo; rosa... 
Aceptar Cancelar 


Nota: Esta figura muestra inserción de las categorias de la variable color en el eje horizontal del 
diagrama de barras, misma que fue elaborada por los autores, 2024 


Dar en clic en aceptar 


Se observan ya los colores con su respectiva frecuencia 


Figura 9 


Eje horizontal y sus categorias 


Título del gráfico 


amarillo rosado azul verde 


a 
[e] 


So o nws uia ss coi 


Nota: Esta figura muestra lo que representa cada barra, misma que fue elaborada por los autores, 2024 


* | Octavo, ahora se va a editar el nombre de la gráfica y cambiar colores si se 
desea 


Hacer doble clic en Título del gráfico y cambiar el nombre 
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Figura 10 


Título principal 


Colores de preferencia 


10 


9 
8 
7 
6 
5 
4 
3 
2 
1 
(o) 


amarillo rosado azul verde 


Nota: Esta figura muestra el título principal cambiado por “colores de preferencia” misma que fue 


elaborada por los autores, 2024 


* Noveno, hacer clic en Disenio de gráfico, posterior clic en Agregar elemento 
de gráfico y se va a insertar los títulos de los ejes horizontal (colores) y vertical 


(frecuencia absoluta) 


Figura 11 


Inserción de título para el eje vertical 


Archivo Inicio Insertar Disposiciónde página Fórmulas Datos Revisar Vista Ayuda Disefio de gráfico Formato 


DE ST Tica = 
EB cmelafabia lo) aisi viole c0oh unhol 
de gráfico = 


rápido» | colores » 


Estilos de diseho 


Mm ges 


€ mb Títulos deleje Ee 
lh Hogan G Ho I ) 


4 h Título del gráfico 


| [B Etiquetas de datos 


lh Mertcal primario 


Más opciones de título de eje... 


lh Tabia de datos 


Ii Líneas de la cuadrícula o o 


Colores de preferencia 


vovv vv vã v 


1 
2 
3 
4 
5 lh Barasdeerror 
6 
7 
8 


nº Leyenda 
[19 


|s 
|| 
7 
| 6 
65 
a 
| 3 
| 2 
|| É 
[o 


amarillo rosado azul verde 


El Título del eje, 


no 


Línea de tendencia > 


O 


5 o 


Nota: Esta figura como agregar un elemento que represente el título del eje vertical de la gráfica, misma 


que fue elaborada por los autores, 2024 


Editamos los nombres de los ejes 
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Figura 12 


Título del eje vertical 


Colores de preferencia 


amarillo rosado azul verde 


o 
[eo] 


Frecuencia absoluta 
rn wr ua coÀÁU 


Colores 


Nota: Esta figura muestra los títulos agregados, misma que fue elaborada por los autores, 2024 


* | Décimo, para cambiar el color de las barras, hacer clic sobre una de las barras y 
aparece una sub-ventana (Formato de serie) en la parte derecha y ahí cambia- 
mos el color en el ícono relleno se van cambiando lo colores de su preferencia. 


Figura 13 


Cambio de color 


E dá l [e] H l Ú EI K L M l N 1. 


Formato depunto... 7. x 
Opciones de serie 

om 

o o 4 Relieno a 
Colores de preferencia Sin relleno, 


=) Relleno sólido. 
Relleno degradado 
Relleno con imagen o textura 


Relleno de trama 


o 
9 

a 

7 

5 

a Automáticos 

4 a 

3 |] Invertirsi es negativo 

2 [ | variar colores entre puntos 

1 

o [&- 


Frecuencia absoluta 


Color 
amarillo rosado azul verde 
Colores Tiansparencia | 


(o) = — a (o) | 4 Borde 


Nota: Esta figura muestra el cambio del color de las barras, misma que fue elaborada por los autores, 
2024 


Se ha cambiado los colores barra por barra 
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Colores de preferencia 


10 
9 
o 8 
E 
E 7 
O 6 
[e] 
ss 
QU 
Sa 
3 
o 3 
— 
e 2 
1 
o 
amarillo rosado azul verde 
Colores 


Nota: Esta figura muestra la edición en el cambio de color de cada barra, misma que fue elaborada por 
los autores, 2024 


Finalmente, si se desea un gráfico en 3D, se hace clic en la pestafia insertar y luego 
en el ícono de gráficos de barras y se selecciona el estilo Columnas 3D 


Figura 14 
Presentación de otro estilo de barras 


Insertar Disposición de página Fórmulas Datos Revisar Vista Ayuda  Disefio de gráfico Formato 


=] E : ” ” ” ER 
E E dg “poor 
Jinámicas llustraciones s Gráficos Columna en 2-D E 
endadas há E] | recomendados 
: k 
B | c D | E | F G Columnas 3D | K 
f 
: dor Jah A ad 
7 
5 Columna agrupada 3D 
5 Barr Permite usar este tipo de gráfico para: 
* Comparar los valores entre algunas 
categorias. 
o o! 
Colore: Úselo cuando: 
« El orden de las categorias no es importante. 
10 Barr... nad! 
E 
5 
Í. as “ 
“6 
e 
2 4. 
E) E 
3 : ln Más gráficos de columnas... 
e 
fra E) 
. o) 
amarillo Tósddo 
azul 
verde 
Colores 
Õ o O 


Nota: Esta figura representa un diagrama de barras en 3D, misma que fue elaborada por los autores, 
2024 
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Figura 15 
Diagrama 3D 


Colores de preferencia 


10 
o 
e 
3 8 
[=] 
“a 
o] 
o 6 
S 
É à 
7) 
o 
E 1 
uu 

0 

amarillo 
rosado 
azul 
verde 
Colores 


Nota: Esta figura muestra un diagrama de barras en 3 dimensiones, misma que fue elaborada por los 
autores, 2024 


HISTOGRAMAS 


Un histograma es un tipo de gráfico utilizado en estadística para representar la 
distribución de frecuencias de datos numéricos continuos, consiste en barras adyacentes 
donde la base de cada una de estas representa un intervalo de valores y la altura de la 
barra representa la frecuencia o cantidad de observaciones dentro de ese intervalo, estos 
son útiles para visualizar la forma y la dispersión de los datos, así como para identificar 
patrones o características importantes en la distribución, por ejemplo, un histograma 
puede mostrar si los datos siguen una distribución normal, están sesgados hacia un lado o 
muestran múltiples picos (Guttman, 1979). 

Para construir un histograma efectivo, hay que seleccionar el número adecuado de 
intervalos (o clases) y el ancho de cada uno, de manera que se represente la distribución 
de los datos sin perder detalles importantes, además, hay que etiquetar adecuadamente 
los ejes del histograma para indicar qué valores representan las barras horizontales y 
verticales. 

Estos gráficos se utilizan en diversas áreas como la investigación científica, la 
ingeniería, la economía y la salud, ya que dan una representación visual poderosa de la 
estructura y las características de los conjuntos de datos numéricos continuos, facilitando 
la interpretación y el análisis estadístico de estos (Rodríguez-Alveal et al., 2024). 
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Formas comunes de Distribución 


Figura 16 


Formas comunes de Distribución 


Frecuencia 
Frecuencia 


0 so 100 120 140 160 2 3 4 5 6 7 
Distribución en forma de campana (Normal) Distribución uniforme 
(a) (b) 
700 7001 
600 600 
soo soo 
pe [o] 
S A, 
ço E 10) 
E E 
e 300 O 3001 
hd pira 
200 2001 
100 1001 
º o 
o 10 20 30 40 so so 40 60 70 so 
Asimétrica a la derecha Asimétrica a la izquierda 
(c) (d) 


Nota: Esta figura fue tomada del Libro Estadística Mario F. Triola, pg. 52 


Ejemplo: 

En la siguiente gráfica se muestra una distribución de datos sobre las edades de las 
personas que ingresan a Laguna Mall el día domingo de 9-10 am en promedio. Elaborar: 

Un histograma de frecuencia absoluta 


Edad F Fr fr % 
(intervalo) 

[0-20) 10 0,125 12,5% 
[20-40) 15 0,1875 18,75% 
[40-60) 25 0,3125 31,25% 
[60-80) 18 0,225 22,5% 
[80-100] 12 0,15 15% 
Total 80 1 100% 
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Solución para el Histograma de frecuencia absoluta 


* Primero, ingresar a Excel y seleccionar la columna desde B2-B6 luego seleccio- 
nar el diagrama de barra y en el ícono Disefio rápido seleccionar el Disehio 8. 


Figura 17 
Gráfico estadístico 
np [E Sim REdEs =. É 
Agregar elemento |Disefio]) | Cambiar | Eq] | Eril | Li cat li silo MIM sala LIT v | fi 5 Combi 
degráfico = Irápido | | colores Z | fila/columna 
Disefios de grá —— — == Estilos de disefo Dat 
éticos /: [iMbe) [ilha] [o 
1 A - —  — D E F 6 Ho | I pasa L 
intervalos f Ah Mb fig 
[0-20) o Es 
[20-40) —| = 
[80-60) he fal Hina 
“|[60-80) = ” Diseão8 
-|[80-100] =— Muestra los siguientes elementos de gráfico: 
] ge! fi] -truio del grárico rd é +] 
=— - Título de eje horizontal Título del gráfico pI 
- Título de eje vertical | 
- Eje horizontal 30 4| 
Eje vertical | | 


4 
Título del eje 


1 2 3 4 5 
Título del eje 


| 
| 
| 
o 


| o 


Nota: Esta figura representa un Histograma de distribución de frecuencias absolutas, misma que fue 
elaborada por el autor, 2024 


* | Segundo, procedemos a editar las etiquetas horizontales, verticales y el título 


Hacer clic en Disefio de tabla y luego en Etiquetas del eje horizontal y selec- 
cionamos desde A2-A6 que corresponde a los intervalos. 


Figura 18 
Histograma 
Seleccionar arigen de datos ? e] l | E) K L 
Rango de datos del gráfico: | =HojaZ!SA$2:$8$6 t 
| EB Cambiar fila/columna | | 
Entradas de leyenda (Series) Etiquetas del eje horizontal (categoria) 
fi 4 .e 
EBagregar | F7Modíficar | X Quitar EP Editar | Título del gráfico 
B series B 020 
B voo 
B oco 
B tos 
B oi 
Celdas ocultas y vacías Aceptar Cancelar 


[0-20) [20-40) [20-60) [60-80) [80-100] 


Título del eje 


Nota: Esta figura muestra la edición del eje horizontal para el histograma, misma que fue elaborada por 
el autor, 2024 
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* | Tercero, colocamos los nombres de los ejes y título 


Figura 19 


Histograma con títulos 


Edad de las personas que ingresan a Laguna Mall 


=] o) w 
[o] [5] [=] 


Frecuencia absoluta 
tá m 
[o (0 


[0-20) [20-40) [40-60) [60-80) [80-100] 
Intervalos de edad 


Nota: Esta figura muestra un histograma con los títulos principal, horizontal y vertical, misma que fue 
elaborada por el autor, 2024 


POLÍGONO DE FRECUENCIAS 


El polígono de frecuencias es una representación gráfica utilizada en estadística 
para visualizar la distribución de frecuencias de un conjunto de datos discretos, traza 
puntos en un plano cartesiano, donde cada punto representa un valor específico de la 
variable y su frecuencia asociada en el conjunto de datos, posterior, se unen con líneas 
rectas para formar un polígono que representa la distribución de frecuencias en diferentes 
valores (Ramírez et al., 2024). 

Para crear un polígono de frecuencias, se deben seguir varios pasos. 

* Se calculan las frecuencias de cada valor en el conjunto de datos. Luego, se 


organizan estos valores y sus frecuencias en pares ordenados (x, y), donde x 
representa el valor y y representa la frecuencia correspondiente. 


* | Posteriormente, se colocan estos puntos en un sistema de coordenadas carte- 
sianas, etiquetando adecuadamente los ejes para representar los valores y las 
frecuencias. 


* Por último, se unen los puntos con líneas rectas para formar el polígono de 
frecuencias. 
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Figura 20 


Polígono de frecuencias en un histograma 


Edad de las personas que ingresan a Laguna Mall 


30 


25 


2.5 2555 


Tiempo de servicio para el almuerzo 
en McDonald's (segundos) 


Nota: La gráfica 2, representa un Polígono de Frecuencias 


Ejemplo: 


Las calificaciones de los exámenes de parcial de Estadística de los estudiantes 


de Educación Inicial obtenidas sobre 20 puntos, se muestran en la siguiente tabla de 


distribución, con estos datos construir el Polígono de frecuencias. 


Calificación Marca de clase Frecuencia fi 
[0-5) 25 3 

[5-10] 7,5 5 

[10-15) 12,5 17 

[15-20] 17,5 8 

Total 33 
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Solución: 


Primero, ingresar en Excel los datos en columnas tanto la calificación, la marca 


de clase como la frecuencia 


Segundo, seleccionar los datos de la columna frecuencia e insertar un gráfica 


en este caso seleccionamos insertar líneas 2D 


Figura 21 


Polígono de frecuencias 
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Tablas Complementos ) Minigráficos 
c2 vi f|3 lá a = b A PY 
A B c D | E F 6 Líneas K L 


Calificació |Marca | de|Frecuencia 


tin 


ES 


Permite usar este tipo de gráfico para: 
+ Mostrar tendencias en el tiempo (aãos, 
meses y días) o por categorías. 


b Úselo cuando: 


* El orden de las categorí 
4 [[10-15) ) - Hay muchos putos det 
5 [15-20] o O 
5 Total 
7 jê Área 2D 
,  nMR 
[o] 14 
1| 12 
2| 61 Área3D 
3] 8 
É NAO 
E 5 
6 4 
7 2 fx Más gráficos de Iíneas... 
8 o 
9 2 2 3 4 
o o, T T O O 


Nota: Esta figura muestra la construcción de un Polígono de frecuencias en Excel, misma que fue 


elaborada por los autores, 2024 


Tercero, editamos la gráfica colocando en eje horizontal. Seleccionar la colum- 
na de las marcas de clase y hacer clic en Aceptar y colocamos los títulos en 
los ejes y nombre de la gráfica. 
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Figura 22 


Polígono de frecuencias 


Rango de rótuios del eye: 
=Hoja3!585248$5 £| =2575 125. 


aceptar Cancelar 


Calificaciones de examen de parcial 


a absoluta 


Frecuer 


2 15 12,3 17,5 


Calificaciones ( marca de claso) 


Nota: Esta figura muestra la edición de los datos del eje horizontal, misma que fue elaborada por los 
autores, 2024 


PASTEL O DIAGRAMA CIRCULAR 


Los diagramas circulares, también conocidos como gráficos de pastel, son una 
herramienta visual comúnmente utilizada en estadística y presentaciones de datos para 
representar proporciones o porcentajes de diferentes categorías dentro de un conjunto 
de datos, los mismos se basan en un círculo dividido en sectores, donde cada sector 
representa una categoría específica y su tamafio angular es proporcional al porcentaje que 
representa en el total, la suma de todos los sectores completa el círculo, lo que permite 
visualizar de manera clara la distribución relativa de las categorías (Ghahramani, 2015). 

Los diagramas circulares son especialmente útiles cuando se desea destacar la 
proporción o contribución de cada categoría dentro de un conjunto de datos; sin embargo, 
es importante utilizarlos con precaución, ya que pueden volverse menos efectivos cuando se 
intenta representar demasiadas categorías o cuando las diferencias entre las proporciones 
son mínimas (Giuliana & Silvana, 2023). 

Para crear un diagrama circular efectivo, es esencial etiquetar cada sector con 
el nombre de la categoría correspondiente y su porcentaje o proporción relativa, es 
recomendable ordenar los sectores de manera que sea fácil identificar las categorías más 


grandes y más pequerfias, los diagramas circulares son ampliamente utilizados en informes, 
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presentaciones y medios visuales debido a su capacidad para resaltar de manera intuitiva 


las proporciones y relaciones entre diferentes partes de un conjunto de datos, lo que facilita 


la comunicación y comprensión de la información estadística (Aguilar et al., 2024). 


Ejemplo: 


Con los datos de la tabla siguiente, correspondiente al tiempo que se demoran unas 


partículas en dar una vuelta elíptica, elaborar un diagrama circular con las frecuencias 


porcentuales. 


Tiempo (segundos) Frecuencia Frecuencia relativa Frecuencia 
absoluta fi fr porcentual fr% 

25 12 0,2 20% 

35 21 0,35 35% 

50 18 0,3 30% 

68 9 0,15 15% 

Total 60 1 100% 

Solución: 


Primero, ingresar a Excel y colocar los datos en las columnas 


Segundo, seleccionamos los datos de la columna de frecuencia absoluta desde 
B2-B5, clic en el ícono insertar y seleccionar Gráfico 2D 


Estadística Descriptiva 


27 


Figura 23 


Diagrama estadístico circular 
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Nota: Esta figura representa un diagrama circular para una distribución de frecuencias, misma que fue 
elaborada por los autores, 2024 


* Tercero, cambiamos estilo de la imagen para que aparezcan los porcentajes 
(frecuencia relativa porcentual), para ello hacer clic en la gráfica, luego clic en 
Disefio de gráfico y seleccionamos el estilo 3. 
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Figura 24 
Edición del Diagrama circular 
nde página Fórmulas Datos Revisar Vista Ayuda  Disefio de gráfico Formato 


o à He 


o 4% 


Estilos de diserio 


a a 


Título del gráfico 


O 


Nota: Esta figura representa un diagrama circular con porcentajes de frecuencia absoluta, misma que 
fue elaborada por los autores, 2024 


* Cuarto, hacer clic en la imagen, luego en Seleccionar datos y editamos los 
datos del eje horizontal, seleccionamos los datos de A2-A5 y clic en Aceptar. 


Figura 25 


Diagrama circular 


Rótulos del eje ? x 


Rango de rótulos del eje: | 
| |=Hojasisas2:sass &| =25/35;50/68 | 


Título del gráfico 


Aceptar Cancelar 


n25 


Nota: Esta figura muestra la edición del título del gráfico, misma que fue elaborada por los autores, 
2024 
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* — Quinto, finalmente, colocamos el nombre 


Figura 26 


Diagrama circular 


Tiempo en segundos de las partículas 
en movimiento 


n25 
35 
=50 
” 68 


Nota: Esta figura muestra los título y colores de representación de sus frecuencias absolutas, misma 
que fue elaborada por los autores, 2024 


Media 


0.4000 Aritmética 


0,5000 


0,4500 


0,3500 
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Fuente: Allende H y Ahumada S, ILI-280 
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UNIDAD 2 


MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN 
CONTENIDO 


é QUÉ SON LAS MEDIDAS DE TENDENCIA CENTRAL? 


Las medidas de tendencia central son estadísticas para describir la ubicación central 
o típica de un conjunto de datos, las tres principales son la media, la mediana y la moda; 
la media aritmética es la medida más común y se calcula sumando valores en el conjunto 
de datos y dividiêndolos por el número de observaciones, sensible a los valores atípicos y 
verse afectada por distribuciones sesgadas (Millán, 2023). 

La mediana es el valor que se encuentra en el centro de un conjunto de datos 
ordenados de menor a mayor, esta es menos sensible a los valores extremos y proporciona 
una medida robusta de la ubicación central. 

La moda es el valor que aparece con mayor frecuencia en un conjunto de datos y 
puede ser útil para describir distribuciones con picos o agrupamientos de datos. 

El uso adecuado de medidas de tendencia central depende del tipo de datos y del 
objetivo del análisis, la media es útil cuando se desea una representación promedio de los 
datos y cuando la distribución es simétrica y no está sesgada. 

La mediana es preferible en presencia de valores extremos o cuando se necesita 
una medida más robusta contra la variabilidad en los datos. 

La moda es efectiva para identificar los valores más comunes en un conjunto 
de datos y puede ser útil en estudios de preferencias o frecuencias; en conjunto, estas 
medidas proporcionan información valiosa sobre la ubicación central de los datos y ayudan 
a resumir la distribución de manera concisa y significativa para el análisis estadístico (Cujba 
& Pifarré, 2024). 
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MEDIA, MEDIANA Y MODA PARA DATOS NO AGRUPADOS 


Figura 28 


Modelo de una matriz de responsabilidad RACI 


MEDIDAS DE TENDENCIA CENTRAL 


PARA DATOS NO AGRUPADOS 


Promedio o Media 


Es el valor promedio de un 
conjunto de datos. 


Mediana 


Es el valor que se encuentra 
justo en medio de los datos. 


Es el valor que aparece con 
mayor frecuencia en el 
conjunto de datos 


Se obtiene ordenado los datos 
en orden ascendente y tomado 
una sola ve y se selecciona el 

valor central 


Se obtiene sumando todos los 
datos y dividiendo para el 
número de datos. 


Se obtiene identificando el 
valor que más se repite. 


Nota: Esta figura representa un ejemplo de una matriz de responsabilidad RACI, misma que fue 
elaborada por los autores, 2024 
Ejemplos: 


* | Encuentre el promedio o media de los datos: 12, 15,18,20 


5x 
N 


12+15+18+20 


X= 


. Encuentre la mediana de los datos: 5, 7,4,3,8,7 


Ordenar los datos y tomarlos una sola vez los datos repetidos: 3, 4, 5, 7,8 


. Encuentre la moda de los datos: 2,3,3,4,5,5,5 


Se observa que el dato que más aparece es el número 5 
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MEDIA, MEDIANA Y MODA PARA DATOS AGRUPADOS 


Figura 29 


Modelo de una matriz de responsabilidad RACI 


Meda E 
N 
“ 
N 
TS 


CCITCICIT O TCESTE SST AS 


Es el cociente la suma de los productos de cada 
marca de clase (x) y su respectiva frecuencia (f o 
fi). dividido entre el total de número de datos (N) 


MEDIDAS DE TENDENCIA CENTRAL 
PARA DATOS AGRUPADOS 


Natas asstas 


Indica el valor intermedio donde aproximadamente 
la mitad de los valores de un con junto de datos 
son menores y la mitad mayores que la mediana. 
Para encontrar la mediana, se deberá emplear la 


Po Moda À 


CCICTITIÇCESTTIO ESSA 


Mediana D) 


y 


(TIL 


Muestra el intervalo que contiene los datos que 
ocurren con mayor frecuencia. generalmente se usa 
con datos cualitativos más que con cuantitativos. 


La fórmula es la siguiente: 


fi-fi- 
M, = Li; - 
E + Esso) 


siguiente fórmula: 


N 
3 Fis 
Me=i+[ 2). 


Nota: Esta figura representa un ejemplo de una matriz de responsabilidad RACI, misma que fue 
elaborada por los autores, 2024 


EXPLICACIÓN DE LAS FÓRMULAS 


Media 


Donde: 
x* f,es el producto de las marcas de clase por su frecuencia absoluta 
N es el número total de datos 


Mediana 
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Nota: Para localizar el intervalo donde se encuentra la mediana se debe tener en 
cuenta lo siguiente: 


N 
posición intervalo = E si Nes par 
E N+&T. . 
posición intervalo = 2 si Nes ímpar 


Finalmente, se ubica el intervalo de clase donde se encuentra la mediana, en el 
primer intervalo de clase donde la frecuencia acumulada (Fi o Fa) es igual o mayor que la 
posición encontrada por las fórmulas. 


Donde: 

L, Límite inferior del intervalo en el cual se encuentra la mediana 

N Número total de datos 

F,, Frecuencia acumulada del intervalo anterior al que se encuentra la mediana 
A Amplitud del intervalo donde se encuentra la mediana 

f, Frecuencia absoluta del intervalo en el que se encuentra la mediana 


Moda 


Mo =L+ (7 DE A 


Nota: el intervalo modal se encuentra en el intervalo que contiene la mayor 


frecuencia absoluta. 


Donde 

L, Límite inferior del intervalo en el que se encuentra la moda 

f, Frecuencia absoluta del intervalo en que se encuentra la moda 
f,, Frecuencia absoluta del intervalo anterior al de la moda 

f 


1 


Frecuencia absoluta del intervalo siguiente al de la moda 
A Amplitud del intervalo donde se encuentra la moda 


Ejemplo: 
Encuentre la media, mediana y moda de la siguiente distribución de frecuencias: 
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Intervalos Marca de clase x | Frecuencia Frecuencia 
absoluta fi acumulada Fi 
[0 - 4) 2 3 3 
[4-8) 6 5 8 
[8 - 12) 10 6 14 
[12, 16) 14 4 18 
[16 - 20) 18 3 21 
Total 21 
Solución: 
Media 
Usamos la fórmula: 
Vo Bxrfi 
“A 
z= Xfi dt xo fo + Xa. fa + Ka. fa + Xs. fo 
N 
so 2(3) + 6(5) + 10(6) + 14(4) + 18(3) 
Ria 21 
— 206 981 
o 
Mediana 


Primero, localizamos el intervalo donde se encuentra la mediana, como N= 21 es 


impar, aplicamos la fórmula: 


posición intervalo=  N+1 
2 

posición intervalo= 21+1 22 E 
A 


Buscamos el valor en la columna de la Frecuencia acumulada F cuyo valor sea 
mayor o igual a 11 
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Figura 30 


Distribución de frecuencias 


Intervalos Marca de Frecuencia  Frecuencia 
clase x “absoluta fi acumulada Fi 


216) 4 4 | 18 
“[16-20) 8 3 21 
Total | 21 


Nota: Esta figura muestra la posición de la mediana, así como su frecuencia acumulada anterior, misma 
que fue elaborada por el autor, 2024 


Segundo, aplicamos la fórmula: 


N 

30 Fis 
M, = L;+ fi 

os 
M,=8+ 4 

10,5 —-8 
M,=8+(5), 
M, = 9,667 


Moda 


Primero, encontramos el intervalo modal que es el intervalo donde se tiene la mayor 
frecuencia absoluta. 
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Figura 27 


Tabla de Distribución de frecuencias 


Intervalos Marca de Frecuencia Frecuencia 


clase x absoluta fi acumulada Fi 
[0 — 4) 2 3 3 
[4— 8) 6 S>fia 8 
Io 10 AD 14 
[12,16) mM 
[16 — 20) 18 3 21 
Total 2! 


Nota: Esta figura muestra la posición de la moda, así como su frecuencia absoluta anterior y posterior, 
misma que fue elaborada por los autores, 2024 


Segundo, aplicamos la fórmula: 


Mo = Li+ (e; — fD)+(f | a 
mê 6—5 4 
1=8+(=55068-9) 

M, = 9,333 


é QUÉ SON LAS MEDIDAS DE DISPERSIÓN? 


Las medidas de Dispersión o Variabilidad, describen cómo de extendidos (separados) 
o agrupados (juntos) están los datos en un conjunto. En otras palabras, nos indican el 
grado de variabilidad que existe entre los valores de una variable alrededor de una medida 
de posición central. Es decir, las medidas de dispersión nos permiten saber si los datos se 
encuentran estrechamente agrupados, si se encuentran ampliamente dispersos o si son 
iguales (Rodríguez et al., 2023). 


Rango, desviación media, varianza, desviación estándar y coeficiente de 
variaza para datos no agrupados y agrupados 

Las medidas de Dispersión o Variabilidad, describen cómo de extendidos (separados) 
o agrupados (juntos) están los datos en un conjunto, en otras palabras, nos indican el grado 
de variabilidad que existe entre los valores de una variable alrededor de una medida de 
posición central. Las medidas de dispersión permiten saber si los datos se encuentran 
estrechamente agrupados, ampliamente dispersos o iguales (Dexeus, 2001). 
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Rango 

El rango o recorrido es la distancia que existe entre los valores extremos máximo y 
mínimo de un conjunto de datos ordenados, es decir es la diferencia entre el valor máximo 
de datos y el valor mínimo de datos. 

Rango = (valor máximo de datos) 2 (valor mínimo de datos) 


Propiedad importante del rango 

El rango utiliza sólo los valores máximo y mínimo de los datos, por lo que es muy 
sensible a los valores extremos. El rango no es resistente. 

Como el rango usa solo los valores máximo y mínimo, no toma en cuenta todos los 
valores y no refleja la variación entre los valores de los datos. 

Ejemplo: 

Encuentre el rango de las velocidades de descarga de datos (en Mbps) para la 
empresa de servicio de internet Redecom: 

38,5 55,6 22,4 14,1 28,1 


Solución: 
El rango se encuentra restando del valor mayor el valor menor 
Rango = (valor máximo) - (valor mínimo) 
R=55,6 - 14.1Mbps 
R = 41,5Mbps 


DESVIACIÓN MEDIA 


Es la media de las distancias de los datos a la meda de los datos de los que 
dispongamos. Es una medida robusta, fácil de interpretar y útil para comparar la variabilidad 
de conjuntos de datos con las mismas unidades. 


Propiedades importantes de la desviación media: 


1. No es afectada por los valores extremos, es decir no se ve afectada por la 
presencia de valores extremos en el conjunto de datos, a diferencia de la 
varianza y la desviación estándar, que sí son sensibles a estos valores. 


2. Se expresa en las mismas unidades que los datos originales, lo que facilita su 
interpretación en términos prácticos. Por ejemplo, si la desviación media de las 
calificaciones de un examen es de 5 puntos, significa que, en promedio, las 
calificaciones se desviaron 5 puntos de la media. 


3. La desviación media siempre es igual a cero cuando todos los valores del 
conjunto de datos son iguales a la media aritmética. Esto indica que no hay 
variabilidad en los datos. 
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4. Cuanto mayor sea el valor de la desviación media, mayor es la dispersión de 
los datos. 


Fórmula para calcular la desviación media 
Ejemplo 1: Para datos No Agrupados 
Encuentre el valor de la desviación media de la siguiente distribución: 3,4,5,5,5,6,17,9 
Solución: 


Primero se debe calcular el promedio o media aritmética 


Lx 34+44+5+5+5+6+17+9 54 


X= 2 == 57 
X N 8 3 6,75 
Segundo se calcula la desviación media 
pM = 21% > 21 
N 


-13-6,75]+|4— 6,75] + |5 — 6,75] + |5 — 6,75] + |5 — 6,75] + ]6 — 6,75] + |17 — 6,75] + ]9 — 6,75] 


DM 8 


37542754 1,75 + 1,75 + 1,75 + 0,75 + 10,25 + 2,25 


DM 
8 


25 
DM = a 3,125 


Ejemplo 2: Para datos Agrupados 


Determine la desviación media para la siguiente distribución de datos, respecto a la 
edad en afios de los estudiantes de Educación Inicial del segundo nivel. 


Edad (intervalos) Frecuencia absoluta X (marca de clase) f*X 
17-20 8 18,5 8*18,5= 148 
21-24 12 22,5 12*22,5= 270 
25 - 28 6 26,5 6*26,5= 159 
29 - 32 5 30,5 5*30,5= 152,5 
33 - 36 10 34,5 10*34,5= 345 
Solución: 


Primero se encuentra la media aritmética: 


PERES 
N 
1484270 +159+152,5+345 10745 
Pee = Cano ag 
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Segundo construimos la siguiente tabla con los cálculos descritos: 


caos Jatedia [ans | — 2] fra! 
17-20 8 18,5 118,5 - 26,21 = 7,7 8*7,7=61,6 
21-24 12 22,5 122,5 - 26,21= 3,7 12*3,7=44,4 
25 - 28 6 26,5 126,5 - 26,21 =0,3 6*0,3=1,8 
29-32 5 30,5 130,5 - 26,21 = 4,3 5*43=21,5 
33 - 36 10 34,5 134,5 - 26,21 = 8,3 10*+8,3=83 
*|X— X 
DM = Lf ? | 
— OL6 + 44,4 + 18+21,5+83 = 212,3 Eca 
41 41 ' 
Varianza 


La varianza sº? de un conjunto de valores es una medida de variación, es la media 
aritmética de los cuadrados de las desviaciones de la media; indica qué tan dispersos están 
los valores del conjunto de datos respecto a su valor promedio (Pino & Estrella, 2012). 

Hay que tener en cuenta que las fórmulas de la varianza y la desviación estándar 
son diferentes para una muestra que para una población. 


Fórmula de la varianza: 


Para datos No agrupados No ordenados 


Para una población Para una muestra 
aro AR save =" 
= sSC>D———————— 
N n—1 
Para datos No agrupados Ordenados 
Para una población Para una muestra 
> Dfrg-3? » Dfsa-? 
oC = ———ees SC=He——— 
N n—-1 
Para datos Agrupados 
Para una población Para una muestra 
» LfX-8?  Lf+(MX—8? 
(=D — sSé="[D——— 
N n-1 
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Ejemplo: 


Determine la varianza de la siguiente distribución: 


Edad fi 
13 3 
14 5 
15 7 
16 10 
17 1 
18 8 
19 2 
Total 46 


* Primero calculamos el promedio o media aritmética: 


13(3) + 14(5) + 15(7) + 16(10) + 17(11) + 18(8) + 19(2) 743 


f= 46 o 16,15 aíios 
* | Segundo completamos la tabla con los cálculos respectivos: 

Edad fi x— X (=x fe(x— x? 
13 3 13-16,15=-3,15 (-3,15)? = 9,92 3*9,92 = 29,76 
14 5 14-16,15=-2,15 (-2,15)2 = 4,62 5*462=23,1 
15 7 15-16,15=-1,15 (-1,15)2 = 1,32 7*1,322=9,24 
16 10 16-16,15=-0,15 (-0,15)? = 0,02 10*0,02=0,2 
17 11 17-16,15=-0,15 (0,85)? = 0,72 11*0,72=7,92 
18 8 18-16,15= 1,85 (1,85)? = 3,42 8* 3,42 = 11,42 
19 2 19-16,15=2,85 (2,85) = 8,12 2*8,12=10,2 
Total 46 


*. Tercero, se determina la varianza: 


, Lftg-? 
Res N 


Tener en cuenta que la sumatoria se debe realizar con todos los datos y sus 
respectivas frecuencias 


— 29,76 +23,1+9,24 + 0,2 + 7,92 + 11,42 + +10,12 91,76 > 


2 
id 46 46 
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DESVIACIÓN TÍPICA O ESTÁNDAR 


Indica qué tan dispersos están los valores del conjunto de datos respecto a su valor 
promedio expresada por s, es una medida de cuánto se desvían los valores de datos de 
la media. Un valor alto de desviación estándar indica que los datos están muy dispersos, 
mientras que un valor bajo indica que los datos están agrupados cerca de la media (Lozano 
& Domich, 2023). 

Algunos ejemplos de su uso son: 


Comparar la variabilidad de diferentes conjuntos de datos, grupos o categorias. 

Se utiliza para determinar la confiabilidad de un instrumento de medición o la 
precisión de un experimento. 

Analizar el riesgo en inversiones en finanzas 

Controlar la calidad en procesos industriales, se utiliza para monitorizar la variabilidad 
en la producción y detectar posibles problemas de calidad. 


La desviación estándar es la raíz cuadrada positiva de la varianza. 
s desviación estândar muestral 


o desviación estândar poblacional 


Fórmula: 


Para datos No agrupados 


Para una población Para una muestra 


Para datos Agrupados 


Para una población Para una muestra 


Eru -? o PIRES 
c= | — s= |[D>—— 
n=1 


 |LfQ-—%? o LfQ—? 
Res N e n-1 
] N 


Coeficiente de Variación (Cv) 


Es la relación entre la desviación típica y su media. El coeficiente de variación se 
suele expresar en porcentaje. 


fo 
Cv =-* 100% 
X 
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Donde: 
o = Desviación típica 
x = media aritmética 


Ejemplo: 


Los datos descritos en la siguiente tabla corresponden a una muestra de la edad de 


los pacientes que asisten a un consultorio médico durante un mes. Determine la desviación 


media, la varianza , la desviación típica y el coeficiente de variación. 


Edad xi fi xifi lxi—x] | |xi— x]. fi (xi — x)? (xi — x)2. fi 
afios (marca 

de 

clase) 
[20-30) 25 20 500 24,65 493 607,62 12152,4 
[30-40) 35 35 1225 14,65 512,75 214,62 7511,7 
[40-50) 45 50 2250 4,65 232,5 21,62 1081 
[50-60) 55 49 2690 5,35 262,15 28,62 1402,38 
[60-70) 65 25 1625 15,35 383,75 235,62 5890,5 
[70-80) 75 15 1125 25,35 380,25 642,62 9639,3 
[80-90] 85 6 510 35,35 212,1 1249,62 7497,72 
Total 200 9930 2476,5 45175,3 


Determinamos el promedio 


Exifi 9930 
No = 700 = 4965 


= 


Determinamos la desviación media 


— Tlxi-z|.fi 24765 


Dm N 200 = 12,38 
Determinamos la varianza 
i— 2.fi  45175,3 
s2= LGi — 3)Ê.fi =——— = 227,01 


n-1 200-1 
Determinamos la desviación típica 


EE 
s= EOiCBÊfi O 57 = 15,06 


n-1 


Determinamos el coeficiente de variación 


-5 1806 0503 - 30,3% 
PES * add 
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UNIDAD 3 


PROBABILIDAD 


La probabilidad es una herramienta esencial en muchos campos, como la 
estadística, la ingeniería, las finanzas, la ciencia de datos y la inteligencia artificial, se 
utiliza para analizar datos, predecir resultados, tomar decisiones bajo riesgo y evaluar la 
confiabilidad de los modelos, como disciplina matemática permite cuantificar y comprender 
la incertidumbre inherente a eventos aleatorios (Vera, 2017). 

En estas secciones se estudiarán la regla de Probabilidad a priori a través del cálculo 
de probabilidades por la regla de Laplace, posterior la probabilidad condicional, reglas de 
suma y multiplicación y finalmente la Distribución Binomial y de Poisson. 


é QUÉ ES LA PROBABILIDAD? 


El concepto de la probabilidad no es ajeno al campo de la ciencia: cuando los 
resultados de los experimentos no pueden predecirse con exactitud, es importante disponer 
al menos de una medida del grado de certidumbre con que puede ocurrir cada uno de sus 
posibles resultados. Esa medida es precisamente lo que Ilamamos probabilidad (Escudero- 
Tena et al., 2024). 

Se puede mencionar que la probabilidad estudia y determina numéricamente la 
posibilidad de que ocurra un evento. Se expresa en un rango de O (imposible) a 1 (seguro). 

Pierre Simon Laplace (1749-1827) define a la probabilidad como una rama de las 
matemáticas que estudia los acontecimientos inciertos o que dependen del azar. 

Para Batanero (2005) es Laplace quien en 1814 introduce el cálculo de la 
probabilidad en términos de razón o fracción. Es lo que hoy en día se conoce comúnmente 
como definición (clásica) de probabilidad. El mismo contempla una totalidad de eventos 
posibles y no posibles. A partir de allí, se busca determinar la probabilidad de ocurrencia de 
algunos de los eventos, considerando la totalidad de eventos. 


CONCEPTOS CLAVES 
Evento: Es un suceso que tiene resultados o consecuencias de un procedimiento. 


Experimento aleatorio: es aquel evento cuyo resultado es incierto, no se puede 
determinar con certeza o está sujeto al azar. Por otro lado, un experimento 
determinista es aquel en el que ya se puede predecir su resultado con anticipación, 
sin realizarlo. 


Evento simple: es cada posible resultado individual de un experimento. 


Espacio muestral: asociado a un experimento aleatorio es el conjunto de todos los 
posibles resultados de un experimento. Representaremos habitualmente el espacio 
muestral por E. 
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Ejemplo: 
Al lanzar un dado, el conjunto de posibles resultados elementales del experimento es 
E =(1,2,3,4,5,6) 


Suceso seguro: Es aquel que podremos predecir que con seguridad ocurrirá al 
realizar el experimento aleatorio. Contendrá pues todos los sucesos elementales, por lo 
que es el propio espacio muestral E. 

Ejemplo: 

Al lanzar un dado al azar, el Suceso Seguro es “Obtener un número del 1 a 6”, es 


seguro que caerá en cualquiera de esos números 


Suceso imposible: Es aquel que podremos predecir que con seguridad no ocurrirá. 
Como conjunto no contendrá a ningún suceso elemental, por lo que se trata del conjunto 
vacio, el cual representaremos por 6. 

Ejemplo: 

Al lanzar un dado al azar, el Suceso “Obtener un número mayor que 6” es un suceso 
imposible. 


CÁLCULO DE PROBABILIDADES 


Determinar la probabilidad de que suceda un evento es encontrar mediante un 
proceso matemático que tan probable o posible es que suceda dicho evento. A continuación, 
se presenta algunas reglas para calcular la probabilidad dependiendo de las condiciones y 
estructura del problema. 


REGLA DE LAPLACE 


Se define la probabilidad frecuentista o empírica o a priori de un suceso A, 
representada por P (A) como el valor obtenido para la frecuencia relativa con que se observa 
A, en un número grande de repeticiones del experimento. Respecto a esta definición se 
tiene la Regla de Laplace que se aplica cuando todos los resultados en el espacio muestral 
son igualmente probables. 


Número de resultados favorables 


P(A)= 
ta, Número total de resultados 


Proceso para determinar la probabilidad de un suceso o evento: 
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1. Definir el evento de interés: identificar claramente el evento cuya probabilidad se 
quiere determinar. Este evento puede ser cualquier suceso que tenga un resultado 
incierto, como obtener una cara específica al lanzar una moneda, sacar un número 
determinado al lanzar un dado, o que un equipo gane un partido de fútbol. 


2. Identificar el espacio muestral: es el conjunto de todos los resultados posibles 
del experimento o situación aleatoria. Es importante considerar todos los 
resultados posibles, sin omitir ninguno. Por ejemplo, al lanzar una moneda, el 
espacio muestral sería (cara, cruz). 


3. Determinar los casos favorables: son los resultados a favor del espacio muestral 
que cumplen con las condiciones del evento de interés. Por ejemplo, si queremos 
saber la probabilidad de obtener cara al lanzar una moneda, el caso favorable sería 
“cara”. 


4. Calcular la probabilidad: Aplicar la regla de Laplace. 


5. Interpretar el resultado: el valor obtenido para la probabilidad representa la 
posibilidad de que ocurra el evento de interés. Una probabilidad de O indica que el 
evento es imposible, mientras que una probabilidad de 1 indica que el evento es 
seguro. Valores entre O y 1 representan la frecuencia relativa del evento. 


Ejemplo 1: 
Se lanza un dado justo de seis caras. ; Cuál es la probabilidad de obtener un 3? 
Dad 
á Dad 
Nm, 4 
V) 


9 
[4 
q: 


Solución: 


Identificar: 

Número de resultados favorables solo hay un 3, entonces es 1caso favorable 
Número toral de resultados son 6 porque 6 caras tiene un dado 

Aplicamos la regla de Laplace: 


Número de resultados favorables 


P(A)= 
ii Número total de resultados 


P(E)= — =0,166 = 16,6% 


1 
6 


Interpretación: La probabilidad de que al lanzar un dado se obtenga un 3 es del 
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Ejemplo 2: 
Tenemos una baraja de cartas común con 52 cartas. Se desea calcular la probabilidad 
de obtener una carta de corazones al azar. 


+ 


pts, 44 
ne 


aottod 4444 


eo 4444 


+ 
+ 
+ 
+ 
de 
e 
= 
= 


eM 


Evento de interés: Obtener una carta de corazones. 
Espacio muestral: Todas las cartas de la baraja, es decir, 52 cartas. (total de casos) 
Casos favorables: 13 cartas de corazones. 


Cálculo de la probabilidad: 


Número de resultados favorables 


P(A)= 
ii Número total de resultados 


Interpretación: La probabilidad de obtener una carta de corazones al azar es de 1/4, 
o lo que es lo mismo, hay un 25% de posibilidades de que ocurra este evento. 


OPERACIONES CON SUCESOS 


Un evento compuesto es cualquier evento que combina dos o más eventos simples. 


UNIÓN DE SUCESOS Y REGLA DE LA ADICIÓN 


La regla de la adición o regla de la suma establece que la probabilidad de ocurrencia 
de cualquier evento en particular es igual a la suma de las probabilidades individuales, si 
es que los eventos son mutuamente excluyentes, es decir, que los dos no pueden ocurrir al 
mismo tiempo (Vásquez & Alsina, 2023). 

La palabra o está asociada con la adición de probabilidades. 
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Expresión matemática 

P(AoB)=P(A)U P(B) = P(A) + P(B) siAy B son mutuamente excluyente, donde A 
y Bno pueden ocurrir al mismo tiempo. 

P(A o B) = P(A) + P(B) - P(Ay B) siAy B son no excluyentes, donde P(Ay B) es la 
probabilidad de que Ay B ocurran al mismo tiempo. 


Ejemplo: 
En una urna se tienen 4 bolas rojas, 3 amarillas, 4 verdes y 2 celestes. Encuentre la 
probabilidad de que al extraer una bola esta sea roja o azul. 


Solución: 

Determinamos el total de casos: sumamos las bolas colores: 4r+3a+4v+2a = 13 
bolas en total 

Casos favorables (bola roja) = 4 

Casos favorables (bola azul) = 2 

La palabra clave es o porlo tanto se debe aplicar la regla de la suma de probabilidades 

Se determina que son mutuamente excluyentes ya no hay la posibilidad de que una 
bola al mismo tiempo sea roja y azul 


Aplicamos la fórmula: 
P (roja o azul) = P(R) + P(A) 


Ptlrojaoazu)= P(R) + P(A) 


P (roi ) 4 2 
roja o azu)= —— + 557 
! 13 13 


6 
P (roja o azul) = Ea = 0,4615 = 46,15% 
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La probabilidad de que el al sacar una bola esta sea de color rojo o azul es del 
33,33%. 


Ejemplo 2: 
é Cuál es la probabilidad de que al lanzar un dado se obtenga un número par o 
múltiplo de 3? 


Solución 

Casos posibles E = (1, 2,3, 4, 5, 6) 6 casos posibles 

Casos favorables P(número par) = 2,4,6 Ilamaremos P(A) 3 casos favorables 

Casos favorables P(múltiplo de 3) = 3,6 llamaremos P(B) 2 casos favorables 

Evento (A y B) Identificamos que no son excluyes, ya que el 6 es a la vez par y 
múltiplo de 3 


Aplicamos la fórmula: 
P(AOB)= P(A) + P(B) - P(AyB) 


P(AOB)= 3 2 1 
= fe 


6 
P(AoB)= 4 
( ) EEN =0, 6666 = 66,66% 


La probabilidad de que al lanzar un dado este se un número par o múltiplo de tres 
es del 66,66% 


INTERSECCIÓN DE SUCESOS Y REGLA DE LA MULTIPLICACIÓN 


Generalmente se emplea esta regla para eventos sucesivos, como por ejemplo 
lanzar una moneda dos veces o más, extraer dos bolas una tras otra. 

La regla de la multiplicación establece que la probabilidad de ocurrencia de dos o más 
eventos estadísticamente independientes, que es igual al producto de sus probabilidades 
individuales. 

La palabra y está asociada a la multiplicación de probabilidades. 
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Notación: 

P(A y B) es la probabilidad de que (el evento A ocurra en un primer ensayo y el 
evento B ocurra en un segundo ensayo) 

P (BIA) representa la probabilidad de que ocurra el evento B después de suponer 


que ya haya ocurrido el evento A. 


P(Ay B)=P(AB)=P(A). P(B) siAy B son independientes. 
P(AyB)=P(AB)=P(A).P(BIA) siAyB son dependientes. 


Precaución: La notación P(AyB) tiene dos significados, dependiendo de su contexto. 
Para la regla de la multiplicación, P(AyB) expresa que el evento A ocurre en un ensayo y 
el evento B ocurre en otro; para la regla de la suma, utilizamos P(AyB) para indicar que los 


eventos A y B ocurren ambos en el mismo ensayo. 


Eventos independientes: si la ocurrencia de uno no afecta la probabilidad del otro. 
Eventos dependientes: si la ocurrencia de uno afecta al otro. 


Ejemplo: 

Evento dependiente 

Una caja contiene 5 canicas azules y 3 rojas. Si se extraen dos canicas al azar sin 
reposición, ;cuál es la probabilidad de que las dos sean rojas? 


Solución: 
Las canicas serán extraídas de la misma caja una tras otra y no serán devueltas a la 
caja (no hay reposición), entonces, se trata de eventos dependientes. 


Total de casos posibles 8 en un principio 
Evento A: obtener una canica roja en la primera extracción 3 de 8 


3 
P(Aj=— 


[0.0] 


Evento B: obtener una canica roja en la segunda extracción 2 de 7 


2 
PA=— 


Aplicamos la fórmula: 
P(AyB)=P(AB)=P(A).P(BIA) 


3 2 
e 
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6 3 
P(AyB)= E la = 0,1071 = 10,71% 


Evento independiente 
En una Unidad Educativa la probabilidad de que un estudiante seleccionado al azar 
hable inglés es de 0,20; mientras que la probabilidad de que un alumno juegue fútbol es 


de 0,80. 
El hecho de que un alumno hable inglés, no afecta en nada que juegue fútbol; por lo 


tanto, se trata de eventos independientes. 


Evento A: que el alumno hable inglés P (A) = 0,20 
Evento B: que el alumno juegue fútbol P (B) = 0,80 


Solución: 
P(AyB)=P(AB)=P(A). P(B) 


P(A y B) = (0,20) . (0,80) 
P(AyB)=0,16 = 16% 


PROBABILIDAD CONDICIONAL 
La probabilidad condicional se refiere a la probabilidad de que ocurra un evento A 
dado que otro evento B ya ha ocurrido, se denota como (PI A) y se lee como “la probabilidad 


de A dado B” 
Sean Ay B eventos tales que P(B) > 00, la probabilidad del evento A condicional a la 


ocurrencia del evento B es: 


P(AnB) 
P(AIB)= ———— 
P(B) 
Ejemplo: 
Al 25% de tus amigos le gusta la fresa y el chocolate, mientras que al 60% le gusta 
el chocolate. ; Cuál es la probabilidad de que a un amigo que le gusta el chocolate, le 


guste la fresa? 
Solución: 


Se tienen 2 eventos: que a un amigo le guste la fresa, y que a un amigo le guste el 


chocolate. 
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Evento A: que a un amigo le gusten los fresa. P(A) = ? 
Evento B: que a un amigo le guste el chocolate. P (B) = 60% = 0,6 
Evento A y B: que a un amigo le guste la fresa y el chocolate. P (AnB) = 25% = 0,25 


Calculamos la probabilidad de que a un amigo le guste la fresa, dado que le gusta 


el chocolate. 

P(AnB) 

P(AIB)= —— 
P(B) 

0,25 
P(AIB)= 

0,6 

5 
P(AIB) = — 

12 


P(AI B) =0,4167 
P(AI B) = 41,67% 


La probabilidad de que a un amigo le guste la fresa dado que le gusta el chocolate 
es del 41,67 %. 
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UNIDAD 4 


DISTRIBUICIÓN DE PROBABILIDAD DE VARIABLE DISCRETA 


DISTRIBUCIÓN DE PROBABILIDAD 


DISTRIBUCIÓN BINOMIAL 


La distribución de probabilidad binomial es una distribución discreta que tiene 


muchísimas aplicaciones, se asocia con un experimento de múltiples pasos que se Ilama 


experimento binomial, la palabra binomial viene de otra palabra que significa “dos nombres” 


y esto nos hará recordar que en cada ensayo que veremos en este tema siempre habrá 


dos resultados: éxito y fracaso, si es que respondes una pregunta de alternativas al azar, la 


respuesta es correcta o incorrecta, si es que realizas un control de calidad a un producto, 


este será defectuoso o no defectuoso, si es que lanzas una moneda, sale cara o sale cruz 
(Ramirez & Fiestas, 2023). 
Una distribución binomial cumple con cuatro requisitos: 


El procedimiento tiene un número fijo de ensayos. (Un ensayo es una sola ob- 
servación). 


Los ensayos son independientes, lo que significa que el resultado de cualquier 
ensayo individual no afecta las probabilidades en los otros ensayos. 


Cada ensayo debe tener todos los resultados clasificados en exactamente dos 
categorías, comúnmente Ilamadas éxito y fracaso. 


La probabilidad de un éxito se conserva igual en todos los ensayos. 


Análisis en un experimento binomial 


Un experimento binomial es un experimento que cumple las siguientes condiciones: 


El experimento consta de una secuencia de n ensayos idénticos. 


En cada ensayo hay dos resultados posibles. A uno de ellos se le Ilama éxito y 
al otro, fracaso. 


La probabilidad de éxito es constante de un ensayo a otro, nunca cambia y se 
denota por p. Por ello, la probabilidad de fracaso será q = (1 — p). Esto se debe 
a que la probabilidad de éxito más la probabilidad de fracaso suman 1. 


Los ensayos son independientes, de modo que el resultado de cualquiera de 
ellos no influye en el resultado de cualquier otro ensayo. 


Antes de resolver un ejercicio aplicando la fórmula de probabilidad binomial, se debe 


verificar siempre que se cumplen estas cuatro condiciones, pues esta fórmula solo funciona 


para experimentos binomiales. 
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Función de probabilidad binomial (fórmula) 


n! 


Parax=0,1,2,...,n 


EL FACTORIAL DE UN NÚMERO N! 


El factorial de un número, representado por el símbolo “!” después del número, se 
define como el producto de todos los números enteros positivos menores o iguales a ese 
número. En otras palabras, multiplicamos todos los números enteros positivos desde 1 


hasta el número en cuestión. 


Por ejemplo: 

El factorial de 5 (escrito como 5!) se calcula así:5!=5x 4x 3x2x1=120 

El factorial de 3 (escrito como 3!) se calcula así: 3!=3 x 2x 1=6 

El factorial de 1 (escrito como 1!) se define como 1, ya que cualquier número 
multiplicado por 1 sigue siendo ese mismo número. 


Ejemplo1: 

Dado que hay una probabilidad de 0.85 de que un adulto seleccionado al azar sepa 
lo que es Twitter, use la fórmula de probabilidad binomial para encontrar la probabilidad de 
que, cuando cinco adultos se seleccionan al azar, exactamente tres sepan qué es Twitter. 
Es decir, aplique la fórmula para encontrar P(3) dado que n=5,x=3,p=0.85 yq=0.15 


Solución: 

n! 
P(9)= ins DE o eo ad 

5! sa 
P(xy)= 6-5 - (0,85)º . (0,15) 

5! 

P(xy)= TETE - (0,85). (0,15)? 
P(x)= 0,138 


P(X)= 13,8% 


La probabilidad de obtener exactamente tres adultos que conozcan twitter entre los 
cinco adultos seleccionados al azar es del 13,8% 
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Ejemplo 2: 

La probabilidad de que a un cliente nuevo le guste la rosanamburguesa de Pancho”s 
food es de 0,8. Si llegan 5 clientes nuevos a la cafeteria, ;cuál es la probabilidad de que 
solo a 3 de ellos les guste la rosahamburguesa? 


Solución: 

Antes de aplicar la fórmula, se debe verificar que se trate de un experimento binomial. 
Para ello, tiene que cumplir con las 4 condiciones que mencionamos arriba. Efectivamente, 
se trata de un experimento binomial. 

n=5 

x=83 

p=0,8 

q=1-p 

q=1-0,8 

q=0,2 


Aplicar la fórmula binomial: 
n! 


fia x! ER x)! 


«ps. qr 


Reemplazamos estos valores en la fórmula: 
5! 


P(x)= 3 ESTERESTE . (0,8)º. (0,2) as 
POd= 3 84321 0.833. (0,2)? 
0-8 2 (2.1) ade 

5.2.1 
PO)=3 ———— :d0;8)º ..(0,2)* 


: 
P()=3 10.(0,8. (0,2)? 
P(9)=3 0,2048 
P()=3 20,48% 


La probabilidad de que de los cincos clientes a tres de ellos les guste la 
rosahamburguesa es del 20,48%. 
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DISTRIBUCIÓN DE POISSON 


La distribución de Poisson, introducida por el matemático francés Siméon Denis 
Poisson en 1837, es una distribución de probabilidad discreta que modela la ocurrencia de 
eventos aleatorios en un intervalo fijo, como el tiempo, la distancia o el área, a lo largo de 
su historia, ha encontrado un amplio espectro de aplicaciones en diversos campos, desde 
la física y la ingeniería hasta la biologia y la economía (Otero-Potosi, 2023). 

Por ejemplo, son variables de Poisson: el número de Ilamadas que recibe una central 
telefónica en el período de 1 minuto, el número de bacterias en un volumen de 1 litro de 
agua o el número de fallas en la superficie de una pieza de cerâmica rectangular. 

Aplicaciones: 

La distribución de Poisson encuentra aplicaciones en una amplia gama de escenarios 
donde se observan eventos aleatorios e independientes en un intervalo específico. Algunos 
ejemplos notables incluyen: 

Telecomunicaciones: Predecir el número de Ilamadas telefónicas que recibe una 
central en un minuto. 

Biologia: Modelar la cantidad de bacterias presentes en una muestra de agua. 

Manufactura: Estimar el número de defectos en una pieza de metal durante el 
proceso de producción. 

Finanzas: Analizar la frecuencia de transacciones en un mercado bursátil. 

Tráfico: Predecir el número de vehículos que pasan por una intersección en una 
hora determinada. 


Características: 

La distribución de Poisson se caracteriza por las siguientes propiedades: 

Eventos aleatorios e independientes: La ocurrencia de un evento no afecta la 
probabilidad de que ocurra otro. 

Intervalo fijo: El número de eventos se observa en un intervalo de tiempo, distancia, 
área o volumen específico. 

Tasa media constante: La tasa promedio de eventos por unidad de intervalo es 
constante. 

Distribución discreta: Los valores que puede tomar la variable aleatoria (número 
de eventos) son enteros no negativos. 
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Ecuación de la Función de Poisson 


eu 
FO)=P(X-)=—— — :X=0;1;2:3,4,5;... 
X! 


Donde: 

f(x) = P(X- x) es la probabilidad de x ocurrencias en un intervalo. 
u es el valor esperado o media de X 

e es la base del logaritmo natural cuyo valor es 2,71828... 


Nota 

En una distribución de Poisson: 
La media de X esiguala u 

La varianza de X es igual a u 


Ejemplo: 
Una empresa recibe un promedio de 10 Ilamadas telefónicas en 60 minutos. Se desea 
calcular la probabilidad de que reciba exactamente 3 Ilamadas en un intervalo de 30 minutos. 


Análisis y solución: 

El promedio de eventos por unidad de intervalo es constante, es decir 10 Ilamadas 
por hora; la tasa para un intervalo de 30 minutos sería 3 Ilamadas por 30 minutos es decir 
0,5 horas. 


Determinamos: 

Primero la variable aleatoria: 

X= número de Ilamadas por hora 

Segundo calculamos la probabilidad de que se reciban 3 Ilamadas en 0,5 horas, es 
decir f(3) 

En el problema se muestra que en promedio ingresan 10 llamadas en 1 hora, 


entonces u=5 


Aplicamos la fórmula de la distribución de Poisson: 


ev 
Fo) =P(X=S)= 
x! 
- 53 
H(3)=P(X=83) Da = 0,1403 = 14,03% 


Por lo tanto, la probabilidad que la empresa espera que en media se reciba 
exactamente 3 Ilamadas es del 14,03%. 
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DISTRIBUCIÓN HIPERGEOMÉTRICA 


La distribución hipergeométrica fue introducida por Jacob Bernoulli, un matemático 
suizo, en su obra “Ars Conjectandi” publicada en 1713. Este trabajo es uno de los textos 
fundamentales en el desarrollo de la teoría de la probabilidad. 

En teoría de la probabilidad y estadística, la distribución hipergeométrica es una 
distribución de probabilidad discreta relacionada con muestreos aleatorios y sin reemplazo. 


Fórmula: 
La probabilidad de obtener exactamente k éxitos en n extracciones sin reemplazo de 
una población de tamafio N que contiene K éxitos se da por: 


(o) 


P(X=k)= (9) 
n 
Donde: 
o es el número de combinaciones de K elementos tomados de k en k. 


N —K 


a es el número de combinaciones de N-K elementos tomados de n-k en 


(a 

n-k. 

(1) es el número de combinaciones de N elementos tomados de n en n. 
n 


APLICACIONES DE LA DISTRIBUCIÓN HIPERGEOMÉTRICA 


La distribución hipergeométrica se aplica en situaciones donde se hacen extracciones 
sin reemplazo. Algunos ejemplos incluyen: 
* | Calidad y Control: En control de calidad, se puede usar para determinar la pro- 


babilidad de obtener un cierto número de artículos defectuosos en una muestra 
de productos de un lote. 


* | Juegos de Azar: En juegos de cartas, se puede usar para calcular la probabili- 
dad de obtener una mano específica en un juego de póker. 


* 'Biología: En estudios de genética, se puede usar para calcular la probabilidad 
de seleccionar un cierto número de individuos con una característica genética 
particular de una población. 


* | Auditorías: En auditorias financieras, se puede usar para determinar la proba- 
bilidad de encontrar un número específico de discrepancias en una muestra de 
transacciones. 

La distribución hipergeométrica es particularmente útil en situaciones donde la 
población es finita y el tamafio de la muestra es una fracción significativa del tamafio de la 
población. 


Distribuición de Probabilidad de Variable Discreta 


61 


Ejemplo: 
Control de calidad 


Una fábrica produce un lote de 1000 piezas, de las cuales 50 son defectuosas. Se 
selecciona una muestra de 10 piezas sin reemplazo. Queremos encontrar la probabilidad 
de que exactamente 2 piezas sean defectuosas en la muestra. 


Datos del problema: 
*. Tamafio de la población (N) = 1000 
* | Número de éxitos en la población (K) = 50 
* Tamaão de la muestra (n) = 10 


* Número de éxitos en la muestra (k) = 2 
Solución: 
Usamos la fórmula de la distribución hipergeométrica: 


N -—K 
P(X pes k) ai o +) 


Primero, calculamos los coeficientes binomiales 


(8) - (6) 100! — 100x99 - 


k 2)" 21(100-2)! 2x1 mid 

N-K. (900). 900! 16 
Sr) sl 8 ET PRADO 
NA (1000) 1000! " 20 
(1) =( 10 )= 101(1000 — 10)! * 2631 * 10 

Finalmente, sustituimos estos valores en la fórmula: 
4950 + 2.160 * 1016 
PX=)=—DD———> — & 0,0407 


2.631 x 1020 


Por lo tanto, la probabilidad de que exactamente 2 bombillas sean defectuosas en la 
muestra es aproximadamente 0.0407, o 4.07%. 
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